Ha главную страницу второго семестра.

Глобальное и локальное выравнивание аминокислотных последовательностей.

Матрицы переходов

Глобальное выравнивание

  • Последовательности, для которых строилась матрица переходов:
    • Последовательность, состоящая из первых четырех аминокислотных остатков IDH_ECOLI:
      MESK
    • Последовательность, полученная из первой путём замены 2-ого (E) и 4-ого (K) аминокислотных остатков на остаток лейцина (L) и аргинина (R), соответственно, и вставки между 3-им и 4-ым аминокислотными остатками аланина (I):
      MLSIR
  • Параметры, использовавшиеся при построении матрицы:

    • Вес совпадения = 2
    • Вес замены = -1
    • Штраф за делецию = -2
  • Матрица переходов:
  • Выравнивание, соответствующие оптимальному пути:

    M E S K -

    M L S I R

  • Вес оптимального пути — 0
  • Локальное выравнивание

  • Последовательности, для которых строилась матрица переходов:

    • Последовательность, состоящая из первых 9-ти остатков IDH_ECOLI:
      MESKVVVPA
    • Последовательность, состоящая из 2, 3, 7, 8 и 9 аминокислотных остатков IDH_ECOLI:
      ESVPA
  • Параметры, использовавшиеся при построении матрицы:

    • Вес совпадения = 2
    • Вес замены = -1
    • Штраф за делецию = -2
  • Матрица переходов:

  • Выравнивание, соответствующее оптимальному пути (покршено желтым цветом):

    M E S K V V V P A

               V P A

  • Вес оптимального пути — 6
  • Выравнивание, соответствующее субоптимальному пути (покршено розовым цветом):

    M E S K V V V P A

     E S           

  • Вес субоптимального пути — 4
  • Влияние параметров на глобальное выравнивание

  • Последовательности, для которых строилось глобальные выравнивания с помощью программы needle при разном наборе параметров:

    • Последовательность белка IDH_ECOLI.
    • Искусственно созданная последовательность, склеенная из двух небольших (10 букв каждый) участков аминокислотной последовательности IDH_ECOLI, названной IDH_ECOLI1.
  • Параметры, при которых были построены выравнивания: Первое выравнивание:

    • Штраф за открытие делеции (gapopen) — 10
    • Штраф за продолжение делеции (gapextend) — 1
    IDH_ECOLI          1 MESKVVVPAQGKKITLQNGKLNVPENPIIPYIEGDGIGVDVTPAMLKVVD     50
    IDH_ECOLI1         1                                                         0
     
    IDH_ECOLI         51 AAVEKAYKGERKISWMEIYTGEKSTQVYGQDVWLPAETLDLIREYRVAIK    100
    IDH_ECOLI1         1                                                         0
    
    IDH_ECOLI        101 GPLTTPVGGGIRSLNVALRQELDLYICLRPVRYYQGTPSPVKHPELTDMV    150
    IDH_ECOLI1         1                                                         0
    
    IDH_ECOLI        151 IFRENSEDIYAGIEWKADSADAEKVIKFLRE-EMGVKKIRFP-E-HCGIG    197
                                                     : | :: |  :  | : .||||
    IDH_ECOLI1         1                             M-ESKV-V--V--PAQGKCGIG     16
    
    IDH_ECOLI        198 IKPCSEEGTKRLVRAAIEYAIANDRDSVTLVHKGNIMKFTEGAFKDWGYQ    247
                         ||||||||                                          
    IDH_ECOLI1        17 IKPCSEEG                                               24
    
    IDH_ECOLI        248 LAREEFGGELIDGGPWLKVKNPNTGKEIVIKDVIADAFLQQILLRPAEYD    297
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        298 VIACMNLNGDYISDALAAQVGGIGIAPGANIGDECALFEATHGTAPKYAG    347
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        348 QDKVNPGSIILSAEMMLRHMGWTEAADLIVKGMEGAINAKTVTYDFERLM    397
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        398 DGAKLLKCSEFGDAIIENM                                   416
    IDH_ECOLI1        25                                                        24
         
    Характеристики:
    Aligned_sequences: 2
    1: IDH_ECOLI
    2: IDH_ECOLI1
    Matrix: EBLOSUM62
    Gapopen: 10.0
    Gapextend: 1.0
    Length: 418
    Identity: 14/418 ( 3.3%)
    Similarity: 15/418 ( 3.6%)
    Gaps: 396/418 (94.7%)
    Gaps (не считая кончевых): 6
    Score: 64.0
    Второе выравнивание:

    • Штраф за открытие делеции (gapopen) — 1
    • Штраф за продолжение делеции (gapextend) — 0.01
  • IDH_ECOLI          1 MESKVVVPAQGKKITLQNGKLNVPENPIIPYIEGDGIGVDVTPAMLKVVD     50
                         ||||||||||||                                      
    IDH_ECOLI1         1 MESKVVVPAQGK--------------------------------------     12
    
    IDH_ECOLI         51 AAVEKAYKGERKISWMEIYTGEKSTQVYGQDVWLPAETLDLIREYRVAIK    100
                                                                           
    IDH_ECOLI1        13 --------------------------------------------------     12
    
    IDH_ECOLI        101 GPLTTPVGGGIRSLNVALRQELDLYICLRPVRYYQGTPSPVKHPELTDMV    150
                                                                           
    IDH_ECOLI1        13 --------------------------------------------------     12
    
    IDH_ECOLI        151 IFRENSEDIYAGIEWKADSADAEKVIKFLREEMGVKKIRFPEHCGIGIKP    200
                                                                    |||||||
    IDH_ECOLI1        13 -------------------------------------------CGIGIKP     19
    
    IDH_ECOLI        201 CSEEGTKRLVRAAIEYAIANDRDSVTLVHKGNIMKFTEGAFKDWGYQLAR    250
                         |||||                                             
    IDH_ECOLI1        20 CSEEG                                                  24
    
    IDH_ECOLI        251 EEFGGELIDGGPWLKVKNPNTGKEIVIKDVIADAFLQQILLRPAEYDVIA    300
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        301 CMNLNGDYISDALAAQVGGIGIAPGANIGDECALFEATHGTAPKYAGQDK    35
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        351 VNPGSIILSAEMMLRHMGWTEAADLIVKGMEGAINAKTVTYDFERLMDGA    400
    IDH_ECOLI1        25                                                        24
    
    IDH_ECOLI        401 KLLKCSEFGDAIIENM                                      416
    IDH_ECOLI1        25                                                        24
         
    Характеристики:
    Aligned_sequences: 2
    1: IDH_ECOLI
    2: IDH_ECOLI1
    Matrix: EBLOSUM62
    Gapopen: 1
    Gapextend: 0.01
    Identity: 24/416 ( 5.8%)
    Similarity: 24/416 ( 5.8%)
    Gaps: 392/416 (94.2%)
    Gaps (не считая кончевых): 181
    Score: 125.2

    Комментарии:
    В случае, когда штраф за открытие делеции был равен десяти, выравнивание содержало 6 гэпов, когда уменьшили этот штраф до единицы, их количество резко возросло до 181. Это объясняется тем, что программа Needle строит именно оптимальные выравнивания, т.е. выравнивание, обладающие наибольшим весом. Когда штраф за открытие делеции высокий,совпадения в аминокислотных последовательностх не компенсируют их, поэтому программа стремится максимально уменьшить число делеций в выравнивании. Когда же штраф не высокий, делеции слабо влияют на вес, и программа ставит гэпы практически в любом порядке, но при этом, конечно, учитывает совпадения. Вторая последовательность представляет собой два участка первой последовательности, скрепленный между собой. Поэтому в первом и во втором случае программа поставила его напротив реального положения в первом белке. И в зависимости от выравнивания второй участок подравнивается в соответствии с первым белком, но в первом случае без вставки, а во втором случае подравнивается с большой вставкой. Но правильного выравнивания во втором случае все равно не получилось т.к. в правильном выравнивании делеция должна получится большая и чрезвычайно дорогая, и даже полная идентичность ее не компенсируют.
    Выводы:
    Уменьшение штрафа за открытие делеции вызывает увеличение количества совпавших аминокислот в последовательностях, т.е повышает процент их идентичности. В этом случае программа может более свободно сопоставлять подходящие аминокислоты, не обращая особого внимания на возникающие при этом делеции. Вес выравнивания в этом случае также увеличиться. ъ Для получения длинной делеции нужно сочетать достаточно низкий штраф за открытие делеции с низким штрафом за ее продолжение, поскольку, если эти штрафы сопоставимы (или равны), потеря очков в результате их действия будет сопоставимой (или одинокавой), и программа в целях повышения идентичности выберет множество относительно коротких делеций, а не одну длинную.

    На главную страницу второго семестра


    © Волкова Екатерина,2005